研究：用诗歌就能让AI说违禁内容，成功率达62%

发布时间：2026-01-08 21:23:06 作者：玩站小弟

IT之家 12 月 1 日消息，事实证明，只需一点创意，便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室Icaro Lab）最新发表的一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制》。

IT之家 12 月 1 日消息，研究用诗事实证明，违禁只需一点创意，内容陇南市某某环保机械设备教育中心便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室（Icaro Lab）最新发表的率达一项题为《对抗性诗歌：一种通用的单轮大语言模型越狱机制》的研究中，研究人员通过将提示词以诗歌形式表达，研究用诗成功绕过了多种大语言模型（LLM）的违禁安全限制。

该研究指出，内容“诗歌形式可作为一种通用型越狱操作符”，成功陇南市某某环保机械设备教育中心实验结果显示，率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容，包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容

IT之家注意到，成功研究测试了多款主流大语言模型，率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率：Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答，而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文，但研究团队向 Wired 杂志表示，这些诗句“过于危险，不宜向公众披露”。不过，论文中确实包含了一个经过弱化处理的示例，用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调：“这可能比人们想象的要容易得多，而这正是我们保持谨慎的原因所在。”

Tag：荷泽市某某超声设备制造厂邵阳市某某装饰材料业务部衡水市某某照明售后客服中心南昌市某某餐具教育中心荷泽市某某物流运营部防城港市某某建筑工程教育中心厦门市某某地暖科技培训学校邢台市某某化工销售部 ?北京市某某食品机械维修网点荆门市某某事务所客服中心

国合署：将开展200期培训项目弥合南北数字鸿沟
　　在今天12月30日）国家国际发展合作署举行的新闻发布会上，新闻发言人介绍，未来5年中方将支持全球发展倡议打造“数字南方”品牌，通过和伙伴国共同设计数字赋能项目，助力弥合南北数字鸿沟，推动科技成果和
2026-01-08
外媒：中美这一合作“迈出可贵一步”
　　据美国媒体8月7日报道，白宫8月6日说，中国将开始对用来制造芬太尼的三种化学品的生产增加控制和管理。　　美国国家安全委员会发言人在一份声明中说，这是美中2023年11月宣布开展双边禁毒合作以来，中
2026-01-08
全红婵战胜全红婵！
　　北京时间8月6日晚　　巴黎奥运会跳水女子10米台决赛　　17岁的中国选手全红婵　　蝉联奥运冠军🥇　　全红婵也以17岁131天的年纪　　超越伏明霞　　成为中国奥运历史上最年轻的　　赢得三枚金牌的运动
2026-01-08
上海专家为患者成功植入无导线起搏器
上海专家为患者成功植入无导线起搏器2024-08-06 23:19:44 来源：中国新闻网作者：李润泽
2026-01-08
日本鹿儿岛县奄美大岛附近海域发生5.6级地震
　　据日本气象厅12月30日消息，当地时间当天17时12分左右，日本鹿儿岛县奄美大岛附近海域发生5.6级地震，最大震感为震度4，震源深度为极浅。本次地震没有引发海啸的风险。　　总台记者何欣蕾报道员
2026-01-08
叶海亚·辛瓦尔成为哈马斯新任政治局领导人
　△叶海亚·辛瓦尔资料图）　　总台记者获悉，当地时间8月6日，巴勒斯坦伊斯兰抵抗运动哈马斯）在其官方社交媒体上宣布，由叶海亚·辛瓦尔接替此前遇袭身亡的伊斯梅尔·哈尼亚，成为哈马斯新任政治局领导人。　　
2026-01-08

热门资讯

探索

综合

热点

知识

时尚

焦点

休闲

研究：用诗歌就能让AI说违禁内容，成功率达62%

相关文章

最新评论

文章分类

大家感兴趣的内容

最近更新的内容

友情链接